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摘 要 : 多 智能 体系 统一 直 是 众多 学 科 领 域 研究 的 主要 研究 对 象 ， 基 于 切换 拓扑 的 多 智能 体 协作 控制 理论 研究 作为 多 
智能 体系 统 研究 的 重要 部 分 ， 一 直 是 近年 来 的 热点 。 为 了 推进 基于 切换 拓扑 的 多 智能 体 协 作 控制 理论 研究 ， 在 广泛 调 
研 现 有 文献 和 最 新 成 果 的 基础 上 ， 从 一 致 性 问题 、 分 布 式 优化 问题 和 分 布 式 估计 问题 三 个 方面 对 该 领域 的 发 展现 状 进 
行 了 总 结 ; 探讨 了 诸如 一 致 性 协议 的 设计 、 一 致 性 协议 的 性 能 分 析 方 法 及 其 优 缺点 、 分 布 式 优化 的 实现 方式 和 分 布 式 
估计 的 实际 应 用 。 最 后 指出 当前 该 领域 尚未 解决 的 问题 和 未 来 的 研究 方向 。 

关键 词 : 多 智能 体 ; 切换 拓扑 ; 协作 控制 

中 图 分 类 号 : TP18 doi: 10.3969/j.issn.1001-3695.2018.01.0124 


Review of research on multi-agent cooperative control based on switching topology 


Xie Guangqiang, Yang Kai, Li Yang’, Xu Feng 
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Abstract: Multi-agent system has always been the main research subject in many disciplines. The multi-agent collaborative 
control theory based on switch topology is an important part of multi-agent system research and has been a hot spot in recent 
years. In order to promote cooperative control theory of multi-agent based on switched topology, based on the extensive 
investigation of the existing literature and the latest achievements, this paper discusses the development of this field from three 
aspects: the consistency problem, the distributed optimization problem and the distributed estimation problem The status quo is 
summarized; such as the design of the agreement, the performance analysis of the agreement and its advantages and 
disadvantages, the realization of distributed optimization and the practical application of distributed estimation. Finally, it points 


out the outstanding issues in the field and the future research directions. 
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着 密切 联系 。 而 多 智能 体系 统 的 网 络 拓扑 结构 时 常 发 生变 化 ， 
一 般 称 这 种 时 变 的 拓扑 结构 为 切换 拓扑 结构 向 。 形 成 切换 拓扑 
多 智能 体系 统 是 由 多 个 具有 独立 自主 能 力 的 智能 体 为 了 完 ”的 原因 多 是 由 于 智能 体 的 位 置 变化 和 智能 体 之 间 的 通信 连接 与 
成 某 个 复杂 任务 通过 局 部 协作 和 相互 作用 而 形成 的 系统 。 多 智 。 断 开 。 切 换 拓扑 结构 可 以 用 动态 图 G(s(r)) 表示 ， 其 中 s(t) 是 
能 体系 统 由 于 其 健壮 、 可 靠 、 高 效 等 特性 ， 在 控制 领域 和 人 工 ”切换 信号 。 
智能 领域 获得 广泛 的 关注 。 研 究 人 员 05 开 创 性 由 现实 环境 的 复杂 多 变 ， 基 于 切换 拓扑 的 多 智能 体 协同 控 
地 将 多 智能 体系 统一 致 性 协议 性 能 与 网 络 的 代数 连通 性 联 =。 制 的 应 用 十 分 广泛 ， 在 工业 制造 中 ， 例 如 用 多 智能 体系 统 进行 
系 起 来 ， 依 靠 控制 理论 工具 建立 起 多 智能 体系 统 稳定 性 中 分 析 ”大 型 物体 或 危险 品 的 搬运 。 在 航天 领域 ， 将 卫星 、 探 测 器 等 航 
方法 ， 采 用 “分 治 ” 负 的 策略 优化 多 智能 体系 统 的 整体 运作 性 。 天 器 编队 进行 宇宙 探测 ， 不 仅 能 提高 系统 的 可 靠 性 ， 还 可 以 完 
能 。 成 单个 航天 器 无 法 完成 的 任务 。 在 恶劣 环境 下 ， 用 智能 体 代 丛 
研究 多 智能 体系 统 ， 主 要 是 通过 分 布 式 控制 多 个 简单 智能 。” 人 类 进行 探索 未 知 环境 的 任务 。 在 军事 领域 中 ， 将 装甲 兵 视 为 
体 进行 协同 合作 来 完成 复杂 的 任务 。 在 实际 应 用 中 ， 多 个 智能 ” 智能 体 ,构建 起 层次 化 的 兵力 智能 体 组 织 结构 , 完成 协同 作战 。 
体 之 间 协 同 合作 外 的 复杂 性 与 多 智能 体系 统 的 网 络 拓 扑 结 构 有 ”所 以 基于 切换 拓扑 的 多 智能 体系 统 协调 控制 自 
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研究 领域 , 主要 问题 包括 一 致 性 问题 [2 分布 式 优化 问题 BE 


和 估计 问题 中 -0 等 。 
1 ”多 智能 体系 统一 致 性 问题 


多 智能 体系 统一 致 性 问题 是 多 智能 体 协 调控 制 研究 中 重要 
的 研究 方面 。 一 致 性 是 指 在 有 限时 间 内 ， 多 智能 体系 统 里 的 所 
有 智能 体 的 某 一 状态 量 根据 分 布 式 控制 协议 进行 变化 ， 最 终 能 
趋 于 相等 。 
一 致 性 问题 主要 包括 聚集 中 一 致 性 追踪 四、 双向 一 致 性 久 10 
等 问题 。 然 而 在 实际 场景 中 扰动 或 通信 范围 的 的 限制 等 情况 都 
会 导致 智能 体 间 的 通信 连接 中 断 ， 意 味 着 系统 的 拓扑 结构 随 着 
时 间 变 化 ， 所 以 基于 切换 拓扑 的 一 致 性 问题 更 贴近 实际 ， 成 为 
当前 的 一 致 性 问题 研究 热点 。 
1.1 一 致 性 协议 
基于 切换 拓扑 结构 的 连续 时 间 一 致 性 协议 由 如 下 : 


H= g D 


其 中 :Ni(?) 表示 变化 的 邻 域 ，aij O) 是 变化 的 拓扑 图 G 在 时 刻 


1 的 邻接 矩阵 中 的 相应 元 素 。 该 协议 ) 

Z=-IZ 

其 中 : L 表示 多 智能 体系 统 网 络 图 的 拉 普 拉 斯 矩阵 。 多 智能 体 

系统 通过 处 理 邻 域 信息 使 得 整个 系统 最 终 趋 于 一 致 的 充分 必要 
为 
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Jadbabaie 等 人 HU 研究 了 基于 无 向 拓扑 图 的 一 阶 线性 多 智 
能 体系 统 ， 并 证 明 只 要 多 智能 体系 统 的 切换 拓扑 是 连通 的 ， 那 
么 智能 体 状 态 值 最 终 会 趋 于 一 致 。 同 时 提出 了 一 种 分 布 式 一 致 
生 控制 协议 : 
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其 中 : y EMER ERRARTE, tot 是 无 限时 间 序 


Bil, k+) Tik = TH KO, 


Ren 等 人 [9 将 Jadbabaie 的 成 果 拓 展 到 有 向 图 中 , 研究 表明 
果 有 向 切换 拓扑 图 集 包 含 足 够 多 的 生成 树 ， 则 多 智能 体系 统 


一 致 性 问题 研究 拓展 到 线性 二 阶 多 智能 体系 统 ，Lin 等 人 
0 基于 连通 的 无 向 切换 拓扑 图 利用 线性 转换 和 构造 Lyapunov 
函数 的 方法 ， 得 到 多 智能 体系 统 收敛 的 标准 条 件 ， 但 该 方法 
未 拓展 到 有 向 图 以 及 更 高 阶 系统 中 。 
HajarA 等 人 0 研究 了 二 阶 有 向 切换 拓扑 多 智能 系统 一 致 
生 问 题 ， 给 出 了 一 个 充分 条 件 ， 在 该 条 件 下 ， 所 有 智能 体 的 状 
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谢 光 强 ， 等 : 基于 切换 拓扑 的 多 智能 体 协 作 控 制 研究 综 述 
态 信息 都 将 接近 相同 值 ， 从 而 系统 最 终 收 敛 。 
考虑 到 高 阶 的 线性 多 智能 体系 统 ，SuY 等 人 05 将 一 类 基于 
无 向 切换 拓扑 结构 的 线性 多 智能 体系 统一 致 性 问题 转换 为 矩阵 
的 稳定 性 问题 ,最 终 系统 得 到 稳定 的 收敛 值 。 由 于 SuY 的 方法 
不 能 应 用 在 有 向 拓扑 图 中 ， 文 献 [16] 设 计 了 一 种 新 的 分 布 式 一 
致 性 控制 协议 ， 若 有 向 切换 拓扑 图 包含 足够 多 的 生成 树 ， 那 么 
系统 在 该 协议 下 可 收敛 。 
实际 场景 中 的 非 线性 因素 众多 ， 所 以 在 研究 线性 连续 时 间 
多 智能 体系 统一 致 性 问题 的 过 程 中 ， 研 究 人 员 逐 渐 开始 重视 非 
线性 连续 时 间 多 智能 体系 统 的 一 致 性 问题 。 
文献 [17] 基 于 非 线 性 多 智能 体系 统 设计 了 动态 一 致 性 协议 ， 
在 该 协议 作用 下 多 智能 体系 统 能 保证 收敛 到 Lyapunov 意义 下 
的 稳定 均衡 。 
文献 [18] 研 究 了 具 固 有 非 线 性 项 的 基于 有 向 切换 拓扑 图 的 
多 智能 体系 统一 致 性 问题 , 若 固 有 非 线性 项 满足 Lipshitz 条 件 ， 
则 采用 变量 变换 方法 将 一 致 性 问题 转换 为 局 部 稳定 性 问题 求解 。 
文献 [19] 研 究 了 基于 无 向 切换 拓扑 的 非 线性 系统 一 致 性 问 
题 ， 提 出 了 一 种 非 光 滑 一 致 性 算法 ， 并 证 明了 有 限时 间 内 算法 
的 收敛 性 。 
基于 切换 拓扑 结构 的 离散 时 间 一 致 性 协议 如 下 : 


zi(k+1)=z;(k)+ a. ž wt (z; (&) -z (4) (4) 
矩阵 的 方式 表示 为 
Z(k +1) = D(k)Z(k) (5) 


其 中 :Ni(6 RERE i MEE ARAREIAI, ay (K) 是 邻接 矩阵 


中 的 相应 元 素 ，。 表示 调整 因子 ， 一 般 取 (0.4],0<4s<l， 
D({k)=1-eL(k), 1 是 单位 矩阵 ，Z(b 是 非 负 矩阵。 

Vicsek 等 人 29 提出 了 著名 的 Vicsek 模型 , 模型 通用 形式 描 
述 如 下 : 


N i 
Xi arg Ox; (: 一 Tj ©) (6) 


其 中 : x) 是 智能 体 


在 时 刻 ; 的 状态 ， 狂 (D>0 是 增益 系数 ， 


EA al) =L ci (0) 是 智能 体 /到 智能 体 i 的 传输 延 时 。 


基于 切换 拓扑 的 多 智能 体系 统 的 传统 分 析 方 法 是 构造 
Lyapunov 函数 ， 但 文献 [21] 证 明了 基于 离散 时 间 切 换 拓扑 的 一 
致 性 算法 不 存在 通用 二 次 Lyapunov 函数 ， 所 以 研究 人 员 开 创 
出 多 种 新 颖 方法 来 研究 一 致 性 问题 。 

Chen 和 Ho 等 人 [P2223] 提出 了 一 种 收缩 集 的 方法 分 析 具 切换 


拓扑 和 时 延 的 离散 时 间 多 智能 体系 统 的 收敛 性 ， 并 进一步 得 到 
了 一 个 线性 多 智能 体系 统 收敛 速率 的 上 边界 。 
Xiao 等 人 [9 使 用 无 限 随机 和 矩阵 乘积 法 证 明了 对 于 一 个 随 


HEREA, Wk G(A) 包含 一 个 生成 树 和 带 自 环 的 根 ， 则 4 是 
SIA 的 ， 从 而 构造 遍历 系数 来 解决 带 时 延 的 一 致 性 问题 。 
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Lin 等 人 5 提出 使 用 一 种 分 布 式 受 限 控制 算法 ， 每 个 智能 
体 的 速度 被 限制 在 一 个 非 凸 集 内 ， 线 性 多 智能 体系 统 在 该 算法 
作用 下 最 终 收 敛 。 

Chen 等 人 的 构造 了 一 类 非 线性 函数 , 如 果 函 数 满足 所 设 定 
的 条 件 ， 且 拓扑 图 是 初始 连通 的 ， 则 智能 体 状态 最 终 会 趋 于 一 
致 。 
1.2 一 致 性 协议 性 能 分 析 方 法 
1.2.1 随机 甜 阵 的 无 限 来 积 法 

Jadbabie 和 Ren $E APG 2 构造 以 下 的 遍历 系数 : 


7 .uN . 
Ms=1= min 2 j=1 TEIS T (7) 


4=(w) ,是 一 个 随机 矩阵 。 若 考虑 到 时 洁 Ps 291, FEB 


机 和 矩阵 A 的 拓扑 图 包含 生成 树 和 有 一 个 自 环 的 根 节点 。 随 机 甜 
阵 的 无 限 乘 积 法 就 可 以 应 用 到 带 时 延 的 线性 Vicsek 模型 。 
1.2.2 公共 李 亚 普 洛 夫 函 数 构造 

文献 [30] 采 用 有 限时 间 Lyapunov 稳定 性 理论 设计 了 基于 无 
向 切换 拓扑 图 的 连续 时 间 非 线性 一 致 性 算法 ， 解 决 了 有 限时 间 
平均 一 致 性 问题 。 

文献 [31] 采 用 构造 多 项 式 Lyapunov 函数 来 研究 非 线 性 多 智 
能 体系 统 的 一 致 性 问题 ， 得 到 的 系统 一 致 性 约束 条 件 更 宽松 。 

文献 [32] 基 于 二 阶 线性 多 智能 体系 统 ， 提 出 若 无 向 切换 拓 
扑 图 是 初始 连通 , 利用 线性 转换 和 构造 Lyapunov 函数 ,从 而 得 
到 二 阶 多 智能 体系 统 的 一 致 性 标准 条 件 。 
1.2.3 归 雇 法 


HI 


归 廖 法 在 文献 [33] 中 被 提出 ， 其 主要 思想 是 当 志 (1)=0 时 ， 
定义 如 下 规则 : 
M(t) = Ey x) 


(8) 


t= mi (t 
m= Pn yD 


如 果 {cj} 是 连通 的 , 则 limsup,,,, M (t) = liminf,_,.. m(t) , 即 所 


有 智能 体 状 态 值 最 终 能 趋 于 一 致 ， 该 方法 在 无 领导 协作 与 领导 
跟随 协作 场景 中 能 有 效 运用 到 很 多 不 同类 型 的 Vicsek 模型 中 。 
1.2.4 李 亚 普 洛 夫 指数 计算 法 

Chen 等 人 鸣 提 出 定义 矩阵 集合 B 的 李 亚 普 洛 夫 指数 : 


(9) 


p(A) = sup limsup ell 
AeB t>% t 


过 将 通用 线性 多 智能 体系 统 的 收敛 性 能 计算 转变 成 给 定 
合 的 李 亚 普 洛 夫 指数 计算 的 方法 ， 从 而 得 出 多 智能 体系 


Vik =fiev m2 a'} 


(10) 


其 中 : 8 是 最 大 时 延 ，m(0)=0,M(0)=1 Blondel 证 明了 存在 一 


He Ya, Yo SD LE, AIH SAR AR 


达到 指数 型 的 收敛 速率 。 
1.2.6 集合 值 分 析 法 

Moreau D] 重 新 定义 了 多 智能 体 稳定 性 ， 提 出 用 集合 值 函数 
来 分 析 衡 量 多 智能 系统 的 稳定 性 ， 令 x 表示 有 限 维 欧 几 里 得 所 
间 ， 映 射 :Nxx 一 x+ ， 则 存在 一 个 半 连 续 的 集合 值 函数 


V:x>x ， 满 足 : 


xeV(x),Vrex 
ys ees CY 
1.2.7 M 4 ik 

Chapman 等 人 B9 基 于 M JEEE EAT ERTED I RK 
渐进 稳定 性 分 析 ， 定 义 非 对 角 元 素 均 为 非 正 的 实 和 矩阵 集合 ZN， 
若 4sZN ， 且 是 非 奇 异 和 矩阵 ， 则 称 4 是 W 矩阵 。 


NxN ify bh ge Baki ok 
Zy ={A=(a,) eR x saj <Oif i ji j=l N} (12) 


2 DARRER 


分 布 式 优化 外 是 通过 多 个 智能 体 之 间 的 协调 合作 有 效 的 解 
决 大 规模 复杂 优化 问题 ， 即 每 一 个 智能 体 都 控制 着 自己 所 了 解 
的 子 问题 ， 而 不 了 解 其 他 智能 体 所 知道 的 信息 ， 必 须 通过 局 部 
信息 交互 获得 一 个 最 优 的 解决 方案 。 

随 着 云 计算 、 大 数据 等 技术 的 快速 发 展 ， 为 优化 多 智能 体 
系统 性 能 ， 提 高 系统 的 收敛 速率 、 模 型 的 鲁 棒 性 及 稳定 性 的 分 
布 式 优化 方法 B7 得 到 了 越 来 越 多 的 重视 。 在 基于 切换 拓扑 多 智 
能 体 协调 合作 中 ， 对 分 布 式 优化 的 传统 研究 方式 是 使 用 目标 代 
价 函 数 ， 为 能 进一步 减少 计算 和 通信 ， 则 用 基于 事件 的 控制 方 


式 等 。 


2.1 目标 代价 函数 
文献 [和 首先 研究 了 基于 一 致 性 框架 条 件 下 的 分 布 式 多 智 


能 体 优化 问题 :最 小 化 D2). eR", FA fR 一 RR 是 一 个 


凸 函 数 。 并 将 平均 一 致 性 算法 和 标准 次 梯度 方式 结合 ， 提 出 了 


N 
RAD = X aj Ox jO -as 0) (13) 


其 中 : a EPK, giha) EO E s (© 时 的 次 梯度 ， 但 


该 分 布 式 解 法 要 求 次 梯度 的 步 长 是 均 方 可 加 的 。 
Wang 等 人 中 进一步 放宽 了 次 梯度 的 步 长 限制 条 件 ， 证 明 


集合 构造 法 在 文献 [35] 中 被 提出 ， 主 要 思想 是 构造 了 以 下 


wing 


了 和 若 次 梯度 的 步 长 选择 遵循 不 可 和 的 原则 ， 能 得 到 更 好 的 多 智 
能 体系 统 收敛 速率 。 


对 于 一 类 局 部 


标 凸 函数 ， 将 分 布 式 追 踪 算 法 与 分 布 式 估 


201805.00016v1 


chinaXiv 


录用 稿 


计算 法 相 结 合 


的 方案 被 Lin 等 人 B9 提 出 ， 同 时 


应 分 布 式 算 法 


于 处 理 通用 


局 部 可 微 


使 得 局 部 


Paolo DL 等 人 [40] 
构造 了 在 整个 智能 体 网 络 中 传播 并 计算 的 非 凸 了 


可 以 


函数 的 导数 | 
有 限时 间 内 趋 于 一 致 。 

在 分 布 式 优化 
的 和 ， 而 代价 函数 


来 构成 。 


标 凸 函数 ， 
MB) 0， 多 智能 体 状态 值 将 在 


原则 利 ) 


以 渐进 收敛 的 方式 得 到 非 凸 优化 问题 的 解 。 


设计 了 一 种 自 ; 


适 


问题 研究 中 的 代价 函数 一 般 是 一 系列 凸 函数 
非 凸 函数 
基于 动态 一 致 j 连 续 凸 近似 技巧 ， 


滑 函 数 ， 从 而 


表 1 一 致 性 性 能 分 析 方法 
方法 方法 特点 
该 方法 要 求 系统 矩阵 必须 是 随机 和 矩阵 ， 若 系统 
BENLE ME TG BR HE AA: _ a 
a 网 络 拓扑 包含 生成 树 以 及 自 环 根 节点 ， 则 可 用 
FIN HAGE vicsek 模型 系统 。 
该 方法 用 于 系统 稳定 性 分 析 ， 依 赖 特 定 条 件 ， 
公共 李 亚 普 洛 夫 函 类 
如 系统 矩阵 左 perron 向 量 相 等 ， 且 在 切换 拓扑 
构造 BoLB2 
下 不 一 定 存在 相应 公共 李 亚 普 洛 夫 函 数 
该 方法 要 求 多 智能 体系 统 网 络 拓扑 图 在 演化 过 
VBE? PEP RRR EI, FPO AE 


李 亚 普 洛 夫 指数 计算 


[34] 


M JERRARD 


t 


vicsek 模型 的 系统 。 


该 方法 将 一 致 性 问题 转 为 给 定 矩 阵 集 的 


Lyapunov 指数 数值 计算 ， 
敛 能 力 ， 能 泛 化 到 更 普 i 
统 。 
该 方法 用 于 非 线性 多 智能 体系 统 的 


分 析 ， 需 满足 应 用 限制 条 件 : 切 
统 满足 凸 性 假设 。 
该 方法 要 求 多 智能 体系 统 网 络 拓扑 图 在 演化 过 


于 分 析 计 算 系 统 收 
的 切换 多 智能 体系 


Wo. FAE 
换 多 智能 系 


文献 [41] 采 用 非 凸 代价 函数 所 
梯度 算法 ， 能 使 智能 体 渐进 收敛 了 


22 ”基于 事件 的 控制 方式 


Dimarogonas 等 人 [%' 3 首次 提 到 将 事 伯 


能 体系 统 中 ， 定 义 智能 体 i 的 测量 误差 : 


从 而 设立 了 事 


i 
a 


mu 


a] SR a; e (0,1) ,对 


| 


F 方 误差 和 |wl|=Zjemey ， 


程 中 保持 点 连通 ， 用 于 带 时 延 的 线性 vicsek 模 
型 系统 。 

该 方法 利用 M 拖 阵 的 左右 零 空 间 刻画 系统 的 固 
有 性 质 和 模型 的 稳定 性 ， 用 于 非 线 性 系统 稳定 
性 分 析 。 

了 一 种 分 布 式 的 近似 双 次 
FF 近似 问题 的 对 偶 解 。 
触发 机 制 用 于 多 智 
al) =x; (4, )-a (0) ee |e 4) (14) 
触发 条 件 : 
pe o4a(1—a|Nj)) 2 (15) 


参数 


0<a<(1/|N,)), zi = Ljen,(%;-*)) é 


Wu 等 人 [利用 预先 估计 的 相 邻 智能 体 的 状态 信息 设计 了 
相应 的 事件 触发 函数 , 并 提出 了 一 种 分 布 式 事件 触发 通信 协议 。 
基于 事件 触发 方式 ， 若 依据 先前 接收 的 数据 和 信息 在 控制 
更 新 时 间 内 预先 计算 了 下 一 个 事件 时 间 ， 则 为 自 触发 方式 ， 自 
触发 方式 能 节省 更 多 的 能 量 。 
文献 [45] 将 事件 触发 系统 与 数据 采样 控制 相 结 合 从 而 设计 
了 分 布 式 自 触发 一 致 性 算法 ， 能 有 效 分 析 普 遍 网 络 拓扑 下 的 事 
件 触发 一 致 性 。 
文献 [46] 放 宽 了 多 智能 体系 统 要 求 网 络 拓扑 连通 性 高 的 条 
件 ， 在 传感器 网 络 中 使 用 自 触发 的 策略 降低 单个 智能 体 的 功 耗 
频率 来 降低 系统 的 整体 能 耗 。 
了 件 的 触发 使 得 两 个 智能 体 通过 无 向 边 进行 连接 ， 从 而 基 
于 智能 体 自己 的 状态 更 新 控制 器 称 为 边 事件 驱动 的 控制 方式 。 
Xiao 等 人 认为 每 个 信息 连接 都 是 独立 定义 的 边 事件 ,从 
而 建立 了 一 种 采用 边 事件 驱动 的 数据 采样 框架 用 于 达到 分 布 式 
状态 一 致 性 要 求 。 
Meng 等 人 [研究 了 多 积分 器 在 切换 网 络 中 的 基于 边 事件 
驱动 的 数据 采样 一 致 性 问题 ， 并 分 析 了 双向 交互 和 领导 跟随 情 
况 下 的 智能 体 状态 一 致 性 。 


3 “分布 式 估计 问题 


分 布 式 估 计 器 对 全 局 系统 进行 估计 [1， 同 时 估计 器 互相 通 
信 将 各 自 对 于 全 局 系统 估计 状态 进行 传输 ， 最 终 实 现 估计 状态 
与 真实 状态 一 致 。 
由 于 智能 体 间 通 信 的 连接 与 断 开 , 网 络 拓扑 是 动态 变化 的 ， 
且 全 局 信息 的 缺失 , 使 得 分 布 式 控制 愈加 复杂 。 在 现实 场景 中 ， 
运用 分 布 式 估计 策略 B69 在 有 限时 间 内 估计 一 些 全 局 信息 ， 从 而 
设计 局 部 控制 器 使 得 多 智能 体系 统 稳定 成 为 当前 的 研究 重点 。 

Zhang 等 人 651 研究 了 受 干扰 的 联合 估计 和 控制 问题 ， 采 用 
Kalman 滤波 的 方式 设计 估计 器 如 下 : 


hint 


alin 


一 1 


一 1 
(rra (M+R) ) ze (16) 


+(1 +(R, +, Jez) Pr 


其 中 : 表示 时 刻 序列 ，Pk 是 测量 向 量 ，z? 是 预测 向 量 ，Gx 


-1 
EREE, (ream) ) cx 是 误差 苏 方差 矩阵 ， 


Federico 等 人 [3 使 用 一 种 扩散 最 小 均 方 的 策略 对 分 布 式 估 
计 问 题 进行 了 深入 的 研究 ， 并 建立 起 扩散 LMS 算法 的 框架 结 
构 ， 该 分 布 式 估计 算法 对 整个 系统 的 节点 和 链 路 故障 具有 良好 
的 鲁 棒 性 。 
文献 [53] 采 用 分 布 式 同步 估计 和 控制 的 方法 ， 将 分 布 式 估 
计 器 用 于 控制 算法 的 设计 ， 同 时 对 智能 体 间 的 合作 提出 了 一 个 
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算法 设计 框架 ， 这 对 解决 联合 估计 和 控制 问题 


HH o 


扩散 。 


文献 [54] 利 用 最 优 滤 波 方法 将 
的 全 局 模型 中 ,使 得 每 个 移动 传感器 的 信息 通过 通信 网 络 进行 


局 部 传感器 数 


极 大 的 推进 作 


据 融入 到 环境 


ChinaXiv 合 作 期 刊 
谢 光 强 ， 等 : 基于 切换 拓扑 的 多 智能 体 协 作 控 制 研究 综述 


a) 当 前 大 部 分 的 研究 是 基于 多 智能 体 间 的 相互 合作 ， 而 很 
少 提 及 竞争 ， 而 在 现实 中 竞争 不 仅 存在 而 且 依据 “优胜 劣 汰 ” 


在 智能 体 协 同 合作 完成 任务 的 过 程 中 ， 多 智 


fatit 


性 。 


通信 图 


的 状态 从 而 


文献 [55，56] 基 了 


向 拓扑 图 和 代数 连通 性 


保证 通信 图 


能 体系 统 的 通 


需要 时 刻 保持 整体 连通 ， 故 多 智能 体系 统 使 用 分 布 式 估 
计算 法 预测 下 一 时 刻 系统 


的 连通 


的 分 散 估计 性 


oF 


质 提 出 了 一 种 基于 梯度 的 控制 策略 ， 并 依据 该 策略 设计 了 控制 
算法 ， 应 用 该 算法 能 保证 通信 图 的 全 局 连通 性 ， 而 无 须 维护 系 


统 之 间 的 局 部 连通 性 。 


文献 [57] 基 于 有 向 


分 


四 


图 


和 相应 维度 的 零 矩阵 , Lp 是 平衡 矩阵 。 


为 将 分 布 式 估计 算法 
要 求 多 智能 体系 统 具 有 高 可 扩 
们 已 经 


景 ， 行 业内 的 研究 者 


应 用 在 无 线 传感器 网 络 
展 性 、 强 鲁 棒 性 以 


改 了 大 量 的 尝试 。 


Yan 等 人 FW 通过 将 无 线 传感器 网 络 进行 节 
设计 了 一 种 基于 信息 一 致 的 


声 提 出 了 一 种 新 的 基 
追踪 目标 的 精确 度 。 
Liu 等 人 多] 在 分 


于 信息 


Seow 


Z 


Li 


致 估计 的 追踪 算法 


线 认 知 网 络 中 使 用 分 布 


测 无 线 电 环 


a 
+ 
G 
PRY 


用 于 
究 了 分 布 式 动态 状态 


显示 地 理 区 域 上 的 无 线 


仅 能 


角 性 并 能 更 有 效 利 


杂 信 息 融 合算 法 ， 同 
以 及 


4 


于 切换 拓扑 的 


Ka 


多 智能 体系 统 协作 控 和 


研究 热点 。 经 过 长 
己 形 成 一 套 理论 框架 


期 的 
本 系 ， 研 究 者 们 开始 重视 基 


用 信息 资 


时 将 算法 应 用 到 目标 可 以 有 多 个 隐 含 模型 
换 马 尔 科 夫 链 的 场景 ， 收 到 了 良好 的 效 


=H 
究 ， 基 于 线性 系统 的 一 


= 


的 一 致 性 问题 、 


号 图 


的 一 致 性 问题 等 更 贴 


十 计 问 题 , 提出 了 不 


提出 了 一 种 以 分 布 式 方法 实现 迭代 的 
层 估计 过 程 ， 并 设计 了 PI 平均 一 致 性 估计 器 : 


P 
E a 
T 
-kLp O 


、 环 境 监 测 等 


及 低 功 耗 的 场 


点 划分 的 方式 


十 计算 法 , 使 两 种 节点 能 协同 合作 ， 
实现 了 对 温度 分 布 的 准确 估计 。 随 后 Yan 进一步 考虑 了 


Tp HGR 
， 从 而 能 提高 


q 


式 估计 方案 预 
有 信号 强度 。 


源 的 分 布 式 复 


FA 


o 


是 控制 领域 的 
致 性 问题 研究 
于 非 线 性 系统 
现实 社会 环 


lj 


近 


境 的 研究 。 司 


式 估计 方法 更 有 效率 的 实现 多 智能 体系 统 的 协同 
BAKU. BARS AMELIE 
的 了 


扑 下 多 智能 体 协 同 合 


= 


时 ， 利 用 寻 


(d: 


牛 触发 方式 等 分 布 式 优 


究 和 实验 已 经 解决 
技术 难题 ， 但 仍然 有 相 


挑战 性 的 研究 问题 待 深入 研究 : 


化 方法 和 分 布 
合作 也 取得 了 
了 许多 切换 拓 
当 多 重要 日 具 


原则 推动 了 整个 群体 结构 变化 ， 在 群体 合作 中 发 挥 着 积极 的 作 
用 。 

b) 在 分 布 式 协议 下 ， 一 些 智 能 体 基于 有 限 的 局 部 信息 无 法 
预测 到 群体 行为 ， 致 使 一 些 智 能 体 的 行为 不 受 控制 。 智 能 体 失 


控 造 成 的 影响 在 动态 变化 的 网 络 拓扑 中 进一步 被 放大 从 而 导致 
整个 多 智能 体系 统 不 稳定 。 所 以 在 控制 协议 设计 中 如 何 去 平 衡 
分 布 式 和 集中 式 ， 最 终 保 证 系统 的 稳定 仍 待 研究 。 

0) 多 智能 体系 统 的 收敛 性 与 网 络 拓 扑 图 的 连通 性 有 密切 联 
系 ， 但 研究 者 们 发 现 智能 体 之 间 更 多 的 联系 并 不 总 能 促进 整个 
系统 更 快 收银 。 所 以 单个 智能 体 在 其 邻 域内 刷 选 出 一 部 分 “ 重 
要 ”智能 体 进行 合作 交流 不 仅 能 保证 相同 的 收敛 速率 更 能 减少 
整个 系统 的 能 耗 。 
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